Phân loại Tiếng Trung Quốc thượng cổ

Hán ngữ trung cổ và các ngôn ngữ lân cận phía nam như Kra–Dai, H'Mông-Miềnchi Vietic thuộc hệ Nam Á sở hữu hệ thống thanh điệu, cấu trúc âm tiết, đặc điểm ngữ pháp và sự bất biến tố tương tự nhau; điều này không phải vì chúng có mối quan hệ "họ hàng", mà là bởi sự tiếp xúc-khuếch tán ngôn ngữ.[4][5] Hiện nay, giới ngôn học đồng tình coi tiếng Trung thuộc về ngữ hệ Hán-Tạng cùng với tiếng Miến Điện, tiếng Tây Tạng và nhiều ngôn ngữ khác rải rác khắp dãy Himalayakhối núi Đông Nam Á.[6] Bằng chứng cho giả thuyết này là hàng trăm từ chung gốc (cogante) đã được tìm thấy,[7] bao gồm nhiều từ vựng cơ bản như sau:[8]

NghĩaTiếng Hán cổ[lower-alpha 1]Tiếng Tạng cổTiếng Miến cổ
'Ngôi nhất số ít' *ŋa[10]ṅa[11]ṅā[11]
'Ngôi hai số ít' *njaʔ[12]naṅ[13]
'Không' *mja[14]ma[11]ma[11]
'Hai' *njijs[15]gñis[16]nhac < *nhik[16]
'Ba' *sum[17]gsum[18]sumḥ[18]
'Năm' *ŋaʔ[19]lṅa[11]ṅāḥ[11]
'Sáu' *C-rjuk[lower-alpha 2][21]drug[18]khrok < *khruk[18]
'Mặt trời' *njit[22]ñi-ma[23]niy[23]
'Tên' *mjeŋ[24]myiṅ < *myeŋ[25]maññ < *miŋ[25]
'Tai' *njəʔ[26]rna[27]nāḥ[27]
'Khớp' *tsik[28]tshigs[23]chac < *chik[23]
'Cá' *ŋja[29]ña < *ṅʲa[11]ṅāḥ[11]
'Đắng' *kʰaʔ[30]kha[11]khāḥ[11]
'Giết' *srjat[31]-sad[32]sat[32]
'Độc' *duk[33]dug[18]tok < *tuk[18]

Mặc dù mối quan hệ này đã được phát hiện vào đầu thế kỷ 19 và hiện được chấp nhận rộng rãi, công cuộc phục nguyên tiếng Hán-Tạng vẫn còn non nớt hơn nhiều so với các hệ như Ấn-Âu hoặc Nam Đảo.[34] Tuy Hán ngữ thượng cổ là thành viên được chứng thực sớm nhất của hệ này, chữ viết tượng hình của người Hán lại không làm rõ cách phát âm của từng từ;[35] gây cản trở công tác khảo cứu. Những khó khăn khác phải kể đến bao gồm sự đa dạng ngôn ngữ cực kỳ lớn, sự bất biến tố của các ngôn ngữ thuộc hệ và sự tiếp xúc-vay mượn giữa các ngôn ngữ trong khu vực. Ngoài ra, nhiều ngôn ngữ nhỏ chưa được mô tả hoàn hảo vì người nói các ngôn ngữ đó cư trú ở các vùng núi và khu vực biên giới nhạy cảm và khó tiếp cận.[36][37]